AI资讯新闻榜单内容搜索-Kimi

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Kimi
模型即 Agent 的含金量:Kimi深度研究功能详评

模型即 Agent 的含金量:Kimi深度研究功能详评

模型即 Agent 的含金量:Kimi深度研究功能详评

大家好,我是歸藏(guizang),今天给大家带来 Kimi 的深度研究能力体验和介绍。

来自主题: AI产品测评
9890 点击    2025-06-24 14:44
Kimi,悄悄推出了一个新 PPT 助手

Kimi,悄悄推出了一个新 PPT 助手

Kimi,悄悄推出了一个新 PPT 助手

相信大家都用过 Kimi,也都用过 Kimi 的 PPT 助手——一键生成 PPT。但是随着各种功能更强、更好用的应用层出不穷,Kimi 近段时间的热度是越来越低了。

来自主题: AI产品测评
11089 点击    2025-06-22 16:33
月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA

月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA

月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA

这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。

来自主题: AI资讯
8358 点击    2025-06-21 19:42
大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报
7720 点击    2025-06-09 11:02
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点,读完会对 GRPO 及其改进算法有更深的理解,进而启发构建推理模型的新思路。

来自主题: AI技术研报
10926 点击    2025-05-24 14:33
扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

当前,强化学习(RL)方法在最近模型的推理任务上取得了显著的改进,比如 DeepSeek-R1、Kimi K1.5,显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能不过,基于 RL 的后训练进展主要受限于自回归的大语言模型(LLM),它们通过从左到右的序列推理来运行。

来自主题: AI技术研报
6612 点击    2025-04-22 08:39
Kimi 开放平台产品价格调整通知

Kimi 开放平台产品价格调整通知

Kimi 开放平台产品价格调整通知

Kimi 开放平台的朋友们,基于 Moonshot AI 一年来的技术积累和性能优化,我们已经在北京时间 2025 年 04 月 07 日 0 点对 Kimi 开放平台提供的模型推理服务进行价格调整,具体调整方案如下:

来自主题: AI资讯
4908 点击    2025-04-08 09:49
今天,Mooncake 获得 FAST 2025「最佳论文」

今天,Mooncake 获得 FAST 2025「最佳论文」

今天,Mooncake 获得 FAST 2025「最佳论文」

北京时间今天凌晨,Kimi 与清华大学合作研发的 Mooncake 项目技术报告获得计算机存储领域顶会 FAST 2025「最佳论文」奖。Mooncake 是月之暗面 Kimi 的底层推理服务平台。

来自主题: AI资讯
9503 点击    2025-02-27 17:04